Evolution de schéma par classification automatique pour les entrepôts de données
نویسندگان
چکیده
Résumé. Les modèles et outils OLAP actuels gèrent les dimensions d’analyse d’un entrepôt de données de manière statique. Par conséquent, les axes d’analyse restent souvent figés malgré l’évolution des besoins et des données. Dans cet article, nous proposons une approche d’évolution de schéma basée sur une technique de classification automatique. Pour cela, nous cherchons le meilleur regroupement des instances d’un niveau d’analyse choisi par l’utilisateur en utilisant la méthode des k-means. Un nouvel axe d’analyse est ensuite construit à partir du résultat de cette classification. Pour choisir les descripteurs du niveau d’analyse à classifier, nous proposons deux solutions: la première utilise directement les attributs décrivant le niveau à classifier. Par contre, la deuxième solution décrit le niveau d’analyse par les mesures dans la table des faits. Pour valider notre approche, nous l’avons intégrée et testée à l’intérieur du SGBD (Système de Gestion de Bases de Données) Oracle 10g.
منابع مشابه
Évolution de schémas dans les entrepôts de données : modèle à base de règles
La mise en œuvre d’un entrepôt de données nécessite un important travail d’étude de l’existant et de recueil de données pour bien traiter les besoins d’analyses. Hors, il est impossible de définir de façon exhaustive ces besoins pour l’ensemble des utilisateurs. La prise en compte de nouveaux besoins d’analyses nécessite l’évolution du schéma de l’entrepôt de données. Deux alternatives existent...
متن کاملMining Frequent Queries in Star Schemes
Résumé. L’extraction de toutes les requêtes fréquentes dans une base de données relationnelle est un problème difficile, même si l’on ne considère que des requêtes conjonctives. Nous montrons que ce problème devient possible dans le cas suivant : le schéma de la base est un schéma en étoile, et les données satisfont un ensemble de dépendances fonctionnelles et de contraintes référentielles. De ...
متن کاملIntégration de données environnementales : une approche basée sur les entrepôts de documents XML et les ontologies
Résumé. Cet article présente l’approche que nous avons adoptée pour résoudre le problème d’intégration de données dans le contexte du projet SIC-Sénégal dont l‘objectif est de permettre à plusieurs organismes partenaires de partager leurs sources de données environnementales. Nous réalisons une intégration en deux phases. Une première phase d’intégration structurelle, basée sur l’utilisation d’...
متن کاملEvolution de modèle dans les entrepôts de données : existant et perspectives
Résumé. Un entrepôt de données permet d’intégrer des sources de données hétérogènes à des fins d’analyse. Un des points clés de la réussite du processus d’entreposage de données réside dans la définition du modèle de l’entrepôt en fonction des sources de données et des besoins d’analyse. Une fois l’entrepôt conçu, le contenu et la structure des sources de données, tout comme les besoins d’analy...
متن کاملUne représentation des arborescences pour la recherche de sous-structures fréquentes
Résumé. La recherche de structures fréquentes au sein de données arborescentes est une problématique actuellement très active qui trouve de nombreux intérêts dans le contexte de la fouille de données comme, par exemple, la construction automatique d’un schéma médiateur à partir de schémas XML. Dans ce contexte, de nombreuses propositions ont été réalisées mais les méthodes de représentation des...
متن کامل